Visão geral

Row

SECTICE 2022

Row

Resumo:

Simulações

Row

Informações

  • Nº de amostras: 100
  • Método de validação cruzada k-fold: dados divididos em \(k\) partes e as partes \(k-1\) serão de treino e a parte que sobra será teste para validar o modelo (HASTIE et al., 2009).
  • Partições: k = 5
  • Espaço tangente: projeção no plano tangente
  • Variâncias (\(\sigma^2\)): 0,001, 0,005, 0,009, 0,01, 0,014,0,018 e 0,02;
  • Classificadores: Support Vector Machine (SVM), Árvores de decisão, Florestas aleatórias, Análise Discriminante de Fisher (ADF) e eXtreme Gradient Boosting (XGBoost).

Método k-fold

Considere \(k = 5\):

Row

Formas médias de triângulos

Resultados

Tabela 1 - Acurácia (%) por classificador pelo método k-fold.
\(\sigma^2\)
Classificador 0,001 0,005 0,009 0,01 0,014 0,018 0,02
SVM - Linear 97,0 83,5 77,0 76,0 71,0 70,0 68,5
SVM - Polinomial 97,0 80,5 74,0 70,0 66,0 61,0 58,0
SVM - Gaussiano 98,5 84,0 78,5 77,5 73,5 73,0 71,5
ADF 70,5 68,0 65,0 65,0 63,5 63,5 63,0
Árvore de decisão 96,5 83,5 78,0 81,5 74,5 71,5 70,5
Floresta aleatória 97,0 82,0 80,0 80,0 74,5 72,0 72,0
XGBoost 98,0 86,5 81,5 81,0 77,0 74,5 75,5

Aplicações

Row

Vértebras de camundongos

Formas médias para os grupos grande e pequeno.

Esquizofrenia

Formas médias do grupo controle e paciente.

Gorilas

Formas médias de crânios de gorilas machos e fêmeas.

Crânios de ratos

Formas médias de crânios de ratos no 7º e 150º dias.

Row

Descrição

  • Vértebras de camundongos: Possui 6 marcos para cada um dos 46 camundongos dos grupos grande e pequeno. Dados utilizados para avaliar os efeitos do peso corporal sobre a forma das vértebras de camundongos grandes e pequenos;
  • Esquizofrenia: Dados cerebrais coletados de ressonâncias magnéticas de voluntários e pacientes esquizofrênicos com intuito de identificar quaisquer diferenças entre o grupo de controle e o grupo de pacientes. Trata-se de coordenadas bidimensionais com 13 marcos para cada um dos 28 indivíduos;
  • Crânios de Gorilas: Dados cranianos de gorilas de modo a avaliar as diferenças entre crânios por espécies e sexo, com 8 marcos para cada um dos 59 primatas;
  • Crânios de ratos: Dados extraídos de raios-X cranianos de ratos. Em cada radiografia foram identificados 8 marcos para cada idade de crescimento. Com intuito de analisar as mudanças entre o início e o fim das etapas de crescimento, avaliou-se os dias 7 e 150.

Resultados

Tabela 2 - Acurácia dos bancos de dados por classificador pelo método leave-one-out.
Acurácia (%)
Classificador Camundongos Esquizofrenia Gorilas Ratos
SVM - Linear 93,48 67,86 98,31 100,00
SVM - Polinomial 86,96 64,29 93,22 100,00
SVM - Gaussiano 91,30 71,43 100,00 100,00
ADF 76,09 46,43 72,88 80,56
Árvore de decisão 95,65 78,57 83,05 100,00
Floresta aleatória 95,65 71,43 94,92 100,00
XGBoost 93,48 67,86 93,22 100,00

Referências

Referências

DRYDEN, I. L. Shapes package. Vienna, Austria, 2021. Contributed package, Version 1.2.6. Disponível em: http://www.R-project.org.

DRYDEN, I. L.; MARDIA, K. V. Statistical Shape Analysis with applications in R. [S.l.]: John Wiley & Sons, 2016.

HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. H.; FRIEDMAN, J. H. The elements of statistical learning: data mining, inference, and prediction. [S.l.]: Springer, 2009. v. 2.

KENDALL, D. G. Shape manifolds, procrustean metrics, and complex projective spaces. Bulletin of the London mathematical society, Wiley Online Library, v. 16, n. 2, p. 81–121, 1984.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2022. Disponível em: https://www.R-project.org/.